Génération de résumés par abstraction complète

نویسنده

Pierre-Etienne Genest

چکیده

This Ph.D. thesis is the result of several years of research on automatic text summarization. Three major contributions are presented in the form of published and yet to be published papers. They follow a path that moves away from extractive summarization and toward abstractive summarization. The first article describes the HexTac experiment, which was conducted to evaluate the performance of humans summarizing text by extracting sentences. Results show a wide gap of performance between human summaries written by sentence extraction and those written without restriction. This empirical performance ceiling to sentence extraction demonstrates the need for new approaches to text summarization. We then developed and implemented a system, which is the subject of the second article, using the Fully Abstractive Summarization approach. Though the name suggests otherwise, this approach is better categorized as semi-extractive, along with sentence compression and sentence fusion. Building and evaluating this system brought to light the great challenge associated with generating easily readable summaries without extracting sentences. In this approach, text understanding is not deep enough to provide help in the content selection process, as is the case in extractive summarization. As the third contribution, a knowledge-based approach to abstractive summarization called K-BABS was proposed. Relevant content is identified by pattern matching on an analysis of the source text, and rules are applied to directly generate sentences for the summary. This approach is implemented in a system called ABSUM, which generates very short and content-rich summaries. An evaluation was performed according to today’s standards. The evaluation shows that hybrid summaries generated by adding extracted sentences to ABSUM’s output have significantly more content than a state-ofthe-art extractive summarizer. Mots clés: Automatic Summarization, Abstractive Summarization, Natural Language Generation, Natural Language Processing

برای دانلود رایگان متن کامل این مقاله و بیش از 32 میلیون مقاله دیگر ابتدا ثبت نام کنید

ثبت نام

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

Transformée de Mellin des intégrales- fibres associées aux singularités isolées d’intersection complète quasihomogènes

Résumé. La transformée de Mellin de l’intégrale -fibre est calculée pour certaines singularités isolées d’intersection complète quasihomogènes (surtout singularités unimodales de la liste de Giusti et de Wall). On montre la propriété de la symétrie des spectres de GaussManin (Théorème 3.1) et on met à jour la structure de réseaux des pôles de la transformée de Mellin, exprimée au moyen des donn...

متن کامل

Transformée de Mellin des intégrales- fibres associées à l’intersection complète non-dégénérée

Résumé. La transformée de Mellin de l’intégrale -fibre est calculée pour certaines classes d’intersection complète non-dégénérée affine, surtout les cas nommés simpliciables. On met à jour la structure de réseaux des pôles de la transformée de Mellin à l’aide des données topologiques qui décrivent la structure de Hodge de la variété affine. On établit la relation de l’intégrale-fibre avec la fo...

متن کامل

Modélisation déclarative et sémantique, ontologies, assemblage et intégration de modèles, génération de code Declarative and semantic modelling, ontologies, model linking and integration, code generation

Ce dossier traite de la représentation des interfaces des modèles dans une ontologie. Il est question des bénéfices retirés de cette approche lorsqu’il s’agit d’assembler et d’intégrer des modèles (partage, réutilisation, qualité, fiabilité, robustesse). Il est présenté l’ontologie MIO (Model Interface Ontology) et une mise en pratique de l’approche sur le projet Seamless-IP par la communauté A...

متن کامل

Remplacement de la malleine classique par un hydrolysat pepsique de Mycobacterium mallei

متن کامل

Description de formes schizogoniques de Babesia bigemina. Comparaison avec des formes identiques, decrites par E. Dschunkowsky, 1937, sous le nom Lushia bovis

متن کامل

ذخیره در منابع من

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

عنوان ژورنال:

دوره شماره

صفحات -

تاریخ انتشار 2009

Génération de résumés par abstraction complète

نویسنده

چکیده

منابع مشابه

Transformée de Mellin des intégrales- fibres associées aux singularités isolées d’intersection complète quasihomogènes

Transformée de Mellin des intégrales- fibres associées à l’intersection complète non-dégénérée

Modélisation déclarative et sémantique, ontologies, assemblage et intégration de modèles, génération de code Declarative and semantic modelling, ontologies, model linking and integration, code generation

Remplacement de la malleine classique par un hydrolysat pepsique de Mycobacterium mallei

Description de formes schizogoniques de Babesia bigemina. Comparaison avec des formes identiques, decrites par E. Dschunkowsky, 1937, sous le nom Lushia bovis

عنوان ژورنال:

اشتراک گذاری